On a défini dans l’exercice 12 du chapitre 4 une variable aléatoire X dont la densité est donnée par la fonction :
pour tout x Î [-1, 1] |
f(x) = 3 x2 / 2 |
On a calculé les probabilités ci-dessous :
P(XÎ[-1, -3/4] ) = 0.2890625 |
P(XÎ[-3/4, -1/2] ) = 0.1484375 |
P(XÎ[-1/2, -1/4] ) = 0.0546875 |
P(XÎ[-1/4, 0] ) = 0.0078125 |
1) On donne ci-dessous l’histogramme et la représentation graphique de la densité théorique :
La proximité entre l'histogramme et la courbe paraît satisfaisante. On notera que la densité théorique est très différente de la loi normale.
2) Le test du c2 permet de contrôler cette proximité. Pour que les conditions de convergence soient satisfaites, on regroupe les classes entre – 0.5 et 0.5. Le tableau de calcul est alors donné ci-dessous :
Classes |
Effectifs observés ni |
Effectifs théoriques ni’ |
Contributions (ni’ – ni’ )2 / ni’ |
[-1.00, -0.75 [ |
66 |
57.8125 |
1.160 |
[-0.75, -0.50 [ |
28 |
29.6875 |
0.096 |
[-0.50, 0.50 [ |
22 |
25.0000 |
0.360 |
[ 0.50 , 0.75 [ |
36 |
29.6875 |
1.342 |
[0.75 ,1.00[ |
54 |
57.8125 |
0.251 |
La valeur x2 de la statistique X2 est égale à la somme des termes de la dernière colonne :
x2 = 4.54 |
Le nombre de paramètres estimés est égal à 0 et donc le degré de liberté à quatre.
n = 4 |
La valeur limite donnée par la table pour n = 4 et a = 0.05 est :
x2 = 9.49 |
On accepte donc l’hypothèse H0 : l’échantillon peut être considéré comme des observations d’une v.a. X de densité f(x) définie précédemment.
3) Les échantillon E1, E2, E3, …, , E100 ont été créés de façon à respecter la loi de la v.a. X. En appliquant le test précédent, on va rejeter l’hypothèse nulle dans 5% des cas, par définition du risque de première espèce. Le nombre B d’échantillons pour lesquels on rejette H0 suit la loi binomiale B(200, 0.05). On peut déduire de cette loi l’intervalle symétrique en probabilité dans lequel se trouvera ce nombre B avec une probabilité de 95%. On notera immédiatement qu’il ne s’agit pas d’un intervalle de confiance, mais de l’interalle vérifiant :
P (b1 < B < b2 ) = 0.95
On utilise pour faire le calcul l’approximation de la loi binomiale B(200, 0.05) par la loi normale d’espérance m = n p = 10 et de variance s2 = n p (1 – p) = 9.5 et d’écart-type s = 3.0822.
P[ - 1.96 < ( B – 10 ) / 3.0822 < 1.96 ] = 0.95
L’intervalle obtenue est donc :
[ 3.959 , 16,041]
On peut donc arrondir à l’intervalle de bornes entières :
[ 4, 16] |
4) On considère l’estimateur empirique M de la moyenne m de la v.a. X. La moyenne et la variance théoriques de X ont été calculées dans l’exercice 12 du chapitre 4 :
m = 0 |
s2 = 0.6 |
On donne ci-dessous l’histogramme des 100 moyennes calculées chacune sur un échantillon de taille 200 :
L’estimateur empirique M a pour moyenne théorique m = 0 et variance s2 / n = 0.003. On peut effectuer un test du c2 pour savoir si la v.a. M suit approximativement la loi normale de moyenne m = 0 et d’écart-type s = 0.05477.
Classes |
Effectifs observés ni |
Effectifs théoriques ni’ |
Contributions (ni’ – ni’ )2 / ni’ |
|
[-0.1171 , -0.0610 [ |
13 |
11.644 |
0.158 |
|
[-0.0610 , -0.0049 [ |
32 |
33.166 |
0.041 |
|
[-0.0049 , 0.0512 [ |
33 |
36.070 |
0.261 |
|
[0.0512 , 0.1073 [ |
17 |
14.989 |
0.270 |
|
[0.1073 , 0.1633 [ |
5 |
2.362 |
2.946 |
|
Répartition des moyennes en 5 classes de même longueur
La somme des contributions donne la valeur x2 :
x2 = 3.667 |
La valeur limite donnée par la table pour n = 4 et a = 0.05 est la même que précédemment :
x2 = 9.49 |
On accepte donc l’hypothèse d’une loi normale. Cette conclusion ne permet pas de considérer qu’un échantillon de taille 200 est suffisant pour que la loi de M soit approximativement la loi normale. Nous laissons le lecteur recommencer le calcul avec 100 échantillons de X de taille 10, dont l’histogramme en 5 classes de même amplitude est donné ci-dessous :
La démarche suivie, ne prouvant pas l’hypothèse nulle, ne pourrait éventuellement montrer que le contraire, qu’elle est insuffisante. C’est le cas de la v.a. S2 dont la loi est très différente de la loi du c2, même pour des échantillons d’effectif élevé. L’histogramme ci-dessous compare la répartition de 100 valeurs s2 calculées chacune sur un échantillon de taille 200 à la loi du c2 correspondante : la différence est évidente.